FakeQuantWithMinMaxVarsPerChannel

对输入数据执行按通道(Per-Channel)的逐元素伪量化运算。该算子将输入数据划分为 channel_num 个等长的通道,每个通道根据其对应的最小/最大值(min_val[c] / max_val[c])独立计算缩放因子和零点,进行模拟量化与反量化。

\[channel\_size = \frac{length}{channel\_num}\]
\[\text{对于通道 } c: \quad scale_c = \frac{max\_val_c - min\_val_c}{quant\_max - quant\_min}\]
\[output_{c,i} = \text{FakeQuant}(input_{c,i}, scale_c, nudge\_min_c)\]
输入:
  • src - 输入数据地址。

  • min_val - 每个通道最小值组成的数组地址。

  • max_val - 每个通道最大值组成的数组地址。

  • length - 输入数据总长度(需能被通道数整除)。

  • quant_min - 量化后的整数最小值。

  • quant_max - 量化后的整数最大值。

  • symmetric - 是否使用对称量化。

  • channel_num - 通道数量。

  • core_mask(int, 可选) - 核掩码(仅适用于共享存储版本)。

输出:
  • output - 伪量化后的计算结果地址。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持:fp32 (fp)

  • MT7004 支持:fp16 (hp), fp32 (fp)

  • 输入数据的总长度 length 必须可以被 channel_num 整除。

  • 每个通道的逻辑(包括 Nudge 零点调整)与单变量版本的伪量化一致。

共享存储版本:

void fp_fake_quant_with_min_max_vars_per_channel_s(float *src, float *min_val, float *max_val, float *output, int length, int quant_min, int quant_max, bool symmetric, int channel_num, int core_mask)
void hp_fake_quant_with_min_max_vars_per_channel_s(half *src, half *min_val, half *max_val, half *output, int length, int quant_min, int quant_max, bool symmetric, int channel_num, int core_mask)

C调用示例:

 1// FT78NE 示例:fp32 类型共享存储多核计算
 2#include <stdio.h>
 3#include <stdbool.h>
 4#include "78NE/utils.h"
 5
 6int main(int argc, char* argv[]) {
 7    float *input = (float *)0xA0000000;
 8    float *min_arr = (float *)0xA1000000;
 9    float *max_arr = (float *)0xA1001000;
10    float *output = (float *)0xB0000000;
11    int length = 960000;
12    int channel_num = 100;
13    int core_mask = 0b1011;
14
15    fp_fake_quant_with_min_max_vars_per_channel_s(input, min_arr, max_arr, output,
16                                                 length, 0, 255, false, channel_num, core_mask);
17    return 0;
18}

私有存储版本:

void fp_fake_quant_with_min_max_vars_per_channel_p(float *src, float *min_val, float *max_val, float *output, int length, int quant_min, int quant_max, bool symmetric, int channel_num)
void hp_fake_quant_with_min_max_vars_per_channel_p(half *src, half *min_val, half *max_val, half *output, int length, int quant_min, int quant_max, bool symmetric, int channel_num)

C调用示例:

 1// MT7004 示例:fp16 (half) 类型私有存储单核计算
 2#include <stdio.h>
 3#include <stdbool.h>
 4
 5int main(int argc, char* argv[]) {
 6    half *input = (half *)0x10000000;
 7    half *min_arr = (half *)0x10008000;
 8    half *max_arr = (half *)0x10008100;
 9    half *output = (half *)0x10009000;
10    int length = 2000;
11    int channel_num = 10;
12
13    hp_fake_quant_with_min_max_vars_per_channel_p(input, min_arr, max_arr, output,
14                                                 length, 0, 255, true, channel_num);
15    return 0;
16}